2025-01-16 15:46:26.AIbase.
Alibaba Cloud lança novo modelo de raciocínio matemático Qwen2.5-Math-PRM; versão de 7B supera o GPT-4o
2025-01-16 10:42:26.AIbase.
Equipe Qwen da Alibaba lança novo modelo de recompensa de processo, evoluindo o raciocínio matemático
2024-12-15 10:23:35.AIbase.
Alibaba lança novo benchmark de IA, "PROCESSBENCH", para avaliar a capacidade de identificar erros em raciocínio matemático
2024-11-18 07:58:19.AIbase.
Kimi lança modelo de raciocínio matemático k0-math: habilidades matemáticas comparáveis à série OpenAI o1
2024-10-14 14:51:30.AIbase.
Equipe de pesquisa da Apple lança novo benchmark GSM-Symbolic: revelando as deficiências no raciocínio matemático de grandes modelos de linguagem!
2024-07-19 16:36:43.AIbase.